2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理

Update: 2025-09-19

Description

本期的 15 篇论文如下：

[00:26 ] 🖥 ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data（ScaleCUA：基于跨平台数据的开源计算机智能体规模化方案）

[01:01 ] 🌊 FlowRL: Matching Reward Distributions for LLM Reasoning（FlowRL：通过流匹配奖励分布提升大语言模型推理能力）

[01:57 ] 🧭 Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration（跨越边界推理：借助测试时深思提升规范对齐）

[02:55 ] 🧬 Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation（无需标签即可让语言模型自我进化：多数选择驱动，新颖性促进变异）

[03:34 ] 🎨 Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation（先理解再生成：面向自回归图像生成的自引导训练）

[04:12 ] 🔍 FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning（FinSearchComp：迈向真实专家级金融搜索与推理评测）

[04:56 ] 🤖 RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation（RynnVLA-001：利用人类示范提升机器人操作能力）

[05:39 ] 🔮 AToken: A Unified Tokenizer for Vision（AToken：面向视觉的统一Tokenizer）

[06:10 ] 🌌 WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance（WorldForge：无需训练即可在视频扩散模型中解锁3D/4D生成的涌现能力）

[06:58 ] 🖼 MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks（MultiEdit：面向多样复杂任务的指令式图像编辑新突破）

[07:54 ] 🎮 RecoWorld: Building Simulated Environments for Agentic Recommender Systems（RecoWorld：为智能推荐系统打造仿真训练沙盒）

[08:28 ] 🎯 Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding（释放多模态大模型零样本时空视频定位潜能）

[09:03 ] 🔍 Mind the Gap: A Closer Look at Tokenization for Multiple-Choice Question Answering with LLMs（留意空格：面向LLM选择题问答的Tokenization再审视）

[09:51 ] 🩺 EchoVLM: Dynamic Mixture-of-Experts Vision-Language Model for Universal Ultrasound Intelligence（EchoVLM：面向通用超声智能的动态混合专家视觉-语言模型）

[10:34 ] 🛰 FSG-Net: Frequency-Spatial Synergistic Gated Network for High-Resolution Remote Sensing Change Detection（FSG-Net：频-空协同门控网络用于高分辨率遥感变化检测）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

【月末特辑】9月最火AI论文 | 群体RL共享降本；SAPO让旧机也能训大模型

2025-10-0223:10

2025.10.01 | 自对弈零标注训练；MCP代理深度评测

2025-10-0111:21

2025.09.30 | SLA稀疏注意力砍算力；StableToken抗噪不训模

2025-09-3011:45

2025.09.29 | 实时长视频边聊边播；分位数基线稳控推理熵

2025-09-2910:55

【周末特辑】9月第5周最火AI论文 | Qwen3-Omni开源称王; 锁定视觉训解码，Baseer刷新阿文OCR；

2025-09-2712:37

2025.09.26 | SciReasoner八项全能；MMR1模糊区炼出开源多模态

2025-09-2611:17

2025.09.25 | 视频模型零样本全能；隐式思维链省token提效

2025-09-2507:59

2025.09.24 | 阿语OCR刷新指标；无标注RL涨分

2025-09-2411:36

2025.09.23 | 少78条示范让AI飙73.5%；免掩膜视频插主体超Pika

2025-09-2311:18

2025.09.22 | 有向图驱动代码生成；双通道视觉统一模型

2025-09-2209:35

【周末特辑】9月第4周最火AI论文 | OmniWorld打造4D数据工厂；WebWeaver让AI边搜边写

2025-09-2013:21

2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理

2025-09-1911:38

2025.09.18 | FP8压缩+翻译微调低成本炼阿语大模型；2B-8B小模型洗数据硬刚GPT-4o

2025-09-1810:41

2025.09.17 | WebWeaver框架提升可信长文报告；Agentic预训练扩展智能体系统

2025-09-1708:01

2025.09.16 | OmniWorld建4D数据底座；UI-S1半在线驯界面代理

2025-09-1609:00

2025.09.15 | 数据集升级测互动；模型大小非长程瓶颈

2025-09-1510:06

【周末特辑】9月第3周最火AI论文 | 群智RL提速大模型；小VLA零预训练控机械

2025-09-1414:35

2025.09.12 | HuMo多模态控人视频；SimpleVLA-RL强化升效

2025-09-1210:34

2025.09.11 | 强化学习提升推理能力；奖励缩放优化视觉生成

2025-09-1105:31

2025.09.10 | 强化学习并行思维；视觉搜索推理扩展

2025-09-1006:51

00:00

2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理

#box-pro-ellipsis-17594003798251{-webkit-line-clamp:2;}2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理

2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理

2025.09.19 | 跨平台GUI模型刷榜；FlowRL分布匹配提推理